Arquitectura para conversión texto-habla multidominio
نویسندگان
چکیده
this paper presents an evolution in the design of multi-domain unit selection text-to-speech (MD-TTS) architecture. The goal of this approach is to achieve good synthetic quality like the limited domain TTS systems, without discarding a general purpose synthesis. The multi-domain architecture entails a speech corpus containing several domains. Moreover, it has been hierarchically structured by means of independent component analysis in order to optimize the unit selection process. On the other hand, MD-TTS demands a module capable to classify the texts in multiple domains, considering the system requirements.
منابع مشابه
Clasificación de textos adaptada para Conversión de Texto en Habla Multidominio
This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the inpu...
متن کاملDialogue System Based on EDECÁN Architecture
References ‣ Lleida, et al.: “EDECÁN: sistEma de Diálogo multidominio con adaptación al contExto aCústico y de AplicacióN”. IV Jornadas en Tecnología del Habla, Zaragoza, Spain, November, 2006. ‣ García, et al.: “Arquitectura distribuida para el desarrollo de sistemas de díalogo hablado, EDECÁN”. V Jornadas en Tecnología del Habla, Bilbao, Spain, November, 2008. ‣ EDECÁN Project, http://www.ede...
متن کاملPHILIPS: Intelligent Speech Interpretation - la tecnología inteligente de reconocimiento de voz
Resumen: Independientemente de la aplicación, el núcleo de cualquier sistema de reconocimiento de voz sigue siendo la inteligencia que convierte el habla en texto. Al reconocer lo que se dice e interpretarlo de forma razonable, garantiza una intervención mínima en el proceso de trascripción para producir informes útiles. Palabras clave: Philips, SpeechMagic, reconocimiento del habla, tecnología...
متن کاملBuscadores de Contenidos para Bibliotecas Digitales: Desarrollo de una Arquitectura para un Buscador XML
Resumen. El gran crecimiento del volumen de datos en las bibliotecas digitales hace necesario el desarrollo de buscadores de información que permitan al usuario encontrar rápida y eficazmente aquello que requieren. El etiquetado XML de los textos permite incorporar información estructural en los contenidos digitales. Las enormes posibilidades de explotación de estos contenidos hacen posibles se...
متن کاملModelo de duración para conversión de texto a voz en euskera
This paper presents the modelling of phone durations in standard Basque, to be included in a text-to-speech system. The statistical modelling has been done using binary regression trees and a large corpus containing 57.300 phones. Several experiments have been performed, testing different sets of predicting factors. The result when predicting durations with this model has a RMSE of 22.23 ms.
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 31 شماره
صفحات -
تاریخ انتشار 2003